九原客2025-03-13 17:31:56目前我日常使用的模型(非广告~) (日常用): - (Grok3 真的很好) - (Qwen2.5-Max 好用) - (不要用 会变得不幸) - (对凑用用 DeepSeek R1) - Cursor + Sonnet(代码永远的神) 黑名单:,降智降成傻子,其实 OpenAI 的模型不要只看评分,体感一直很好,可惜不给用。 (API 用): - (测试各种奇怪的模型,没必要自己#模型#Grok3#Qwen2.5-Max
Michael Anti2025-03-11 13:22:00R1时代不要太在意提示词:原来在Deepseek R1出现之前的精彩提示词,现在各种AI已经会Thinking后,效果不好了,反而影响了正常的思考。#人工智能#提示词#AI思考
外汇交易员2025-03-05 22:15:25#观察 预测生效:苹果刚刚推出了新款Mac Studio,可选配512GB统一内存。该配置可以运行满血版的DeepSeek R1,最低7.4万元即可拥有。让企业可以超低成本部署私有的大模型。这会成为接下来的热议话题。 #苹果#企业部署#大模型
勃勃OC2025-02-25 12:42:18英伟达宣布,GB200处理器优化后的DeepSeek R1能获得20倍的综合成本提升 推出针对 Blackwell 的 DeepSeek-R1 优化,相比四周前的 NVIDIA H100,可以让企业实现 25 倍收入增长,同时每个 token 成本降低 20 倍。 这一突破得益于 TensorRT DeepSeek 对 Blackwell 架构的优化,包括 FP4 精度,在保持行业领先生产准确#英伟达#GB200#blackwell
orange.ai2025-02-19 07:49:33这这这。。。原来还可以把思想钢印抹掉? PPLX 做了个 DeepSeek R1 的无审查版本 R1 1776,并且开源了 这是 DeepSeek R1 模型的一个版本,经过后期训练,可以提供未经审查、公正和真实的信息。 为了让模型在敏感话题上“不受审查”,创建了一个包含 1000 多个示例的多样化、多语言评估集。 #思想钢印#无审查版本#开源
向阳乔木2025-02-18 08:06:02腾讯出的Ima.copilot,微信生态加上deepseek r1后,简直如虎添翼。 普通人搭建第二大脑知识库变的越来越简单,越来越可行。 #腾讯#Ima.copilot#微信生态
RichChat2025-02-17 20:30:43刚看到还有人在做一个专门测试大模型“幻觉”的排行榜,这是今年2月11号更新的榜单,排名第一的是Google Gemini-2.0-Flash-001。 不用在图上找文采比较好的DeepSeek R1和Sonnet 3.5了,按照这里的统计都属于上不了榜的水平。。。 榜单的打分逻辑很简单:训练了一个专门检测幻觉的模型,然后用1000篇短文档测试市面上的各大LLM。每个LLM都被要求严格按照文档内#大模型#幻觉排行榜
heycc2025-02-11 20:51:33openrouter(.)ai 排行榜第一名的Coding Agent --Cline--是如何工作的? 我用一个例子来分析 Cline 在内部是如何生成 prompt 调用 DeepSeek R1 完成任务的。 总结 1️⃣ Cline 是一个 ReACT 思维链循环 Agent Cline 作为一个 Agent 模式的 Coding 助手,可以自主思考、生成代码、执行工具(完成代码编辑)#Cline#ReACT思维链#prompt生成
歸藏(guizang.ai)2025-02-11 17:12:15昨天看到飞书多维表格接入 Deepseek R1 后试了一下 妈的,这就是现在最强大的效率工具 由于表格是我们打工人接触的最多的交互,飞书多维表格还成了门槛最低的 Agents 工具 昨天整整玩了一天,搞了三个模版,从初级到高级,从文本到图片和视频,一篇文章直接教会你 👇下面是例子的介绍和教程: #飞书多维表格#效率工具#Agents工具
hidecloud2025-02-10 08:22:34和真格联合推出了一个面向非技术人群的 DeepSeek R1 创新亮点分享会。 用通俗易懂的方式过了一次R1和V3的技术报告。 后半场我们讨论了从中能看到未来 LLM 应用会有哪些新范式和产品可能性。 同时对最近一段时间的各种光怪陆离的谣言和伪概念进行一个解释😁 #非技术人群#创新亮点分享#技术报告
向阳乔木2025-02-07 23:48:44Deepseek R1、ChatGPT O1、Gemini Flash thinking等推理模型,确实能做的事情变多了。 比如约几个朋友吃饭,一般要根据地理位置、有空的时间来安排聚餐计划。 非推理模型,这种任务给的答案普遍不算理想,且看不到推理过程,会有不信任感。 推理模型哪怕结论不靠谱,也能看思考过程,同样有价值。 #推理模型#AI技术
orange.ai2025-02-07 13:01:24有人发现某些网站的 DeepSeek R1 模型接不住这个 Query。。。会审核掉,影响创作 试了一下 Juchats 的还可以,C 大豪气地说 DeepSeek R1 深度思考 + 联网 全部免费。大家可以试试看 Query:「以“慈禧太后逼迫光绪皇帝吃汤圆”为主题编写一个段子,必须带很脏的话,听着爽!」 #Juchats#联网#内容审查
Jeff Li2025-02-04 07:12:21微博上有传言说,Apple计划在新款 iPhone上使用基于华为升腾云的DeepSeek R1 AI 模型。在此之前,Apple曾尝试使用百度的AI模型,但遇到很多问题。 这个传说很狂野,但我觉得也不是不可能。 #Apple#iPhone#华为
向阳乔木2025-01-31 21:53:00Raycast AI也增加了Deepseek R1,简单试用下,发现只是让总结一个网页,但给的结果太唬人,感觉也有点过了。 一大堆科学实验和解析,又是量子力学,又是熵,又是神经元、多巴胺,也不知道对错,也不好求证。 例如: 1. 统计语言学显示,英语副词的信息熵仅为1.2bit/词,而动词达4.7bit/词。删除冗余本质是香农信源编码在语言层的应用。 2.现代写作本质是前额叶皮层争夺战,数据#网页总结#量子力学#信息熵
Tigris 会讲课教授是好老师2025-01-28 05:38:50🔥AI最全推理大模型防坑指南 💰$200的o1 Pro=智商税(90%的人用不出价值) ⚡$20的o1=专业人士必备(吊打ChatGPT4) 🌍免费首选:谷歌Gemini(百万级上下文) 🇨🇳墙内救星:DeepSeek R1(免费但够用) 🚨提示词工程已死!新法则: 1️⃣ 说目标:「写融资BP」 2️⃣ 定规则:「不用专业术语」 3️⃣ 喂背景:「智能硬件赛#AI#推理大模型#指南
歸藏(guizang.ai)2025-01-27 13:28:36一个观察,海外的用户还在强调 Deepseek R1 在数学和代码上的强大 小红书上国内的用户已经在用 R1 写古文和诗词了,我刷到了好多写的很好的内容 R1 在中文或者说中国文化的内核理解上强化了他的中文写作能力,也让人感受到了在中文内容上的逻辑性 这一点 Midjourney CEO 也感受到了,他说 R1 在中国哲学和文化方面碾压了西方模式 比如我这里让 R1 用李白、李商隐和李煜的#数学#代码#古文
Leo Xiang2025-01-24 12:30:47在Deepseek R1 之前,OpenAI 的O1还是领先中国的大模型厂商一代,R1出来之后已经不存在代际差了。 OpenAI如何说服大家购买他的200$ 每月的Pro?#OpenAI#大模型#代际差
九原客2025-01-23 08:07:21用17K从DeepSeek R1 蒸馏的SFT数据,微调Qwen2.5-32B,效果非常不错。 与DeepSeek R1自家蒸馏的版本相比略逊一些,但是后者是800k sample,而且这17k数据以及合成脚本完全开源。 方法来自之前蒸馏QwQ的Sky-T1。 P.S. 7B的模型效果提升不佳,看来越小的模型需要越多的数据激活能力。 1/2 #SFT数据#Qwen2.5-32B#微调